{
 "metadata": {
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.2"
  },
  "orig_nbformat": 2,
  "kernelspec": {
   "name": "python3",
   "display_name": "Python 3.9.2 64-bit",
   "metadata": {
    "interpreter": {
     "hash": "0d008810b9c8467bcb3ca39aa2180e5b81b3a9acb136aab30d47954377cc5120"
    }
   }
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2,
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 26,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas_profiling\n",
    "import pandas as pd\n",
    "import numpy as np "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 27,
   "metadata": {},
   "outputs": [
    {
     "output_type": "execute_result",
     "data": {
      "text/plain": [
       "                   日期              编号 序号 工作地点  \\\n",
       "0  28/2/2021 00:00:00  GZ202102280008  1  慈溪变   \n",
       "1  28/2/2021 00:00:00  GZ202102280074  2  福明变   \n",
       "2   1/3/2021 00:00:00  GZ202103010267  1  慈溪变   \n",
       "\n",
       "                                                工作内容 工作单位 工作负责人  \\\n",
       "0                       #2、#3主变配合110kV侧35kV构架拆除，主变陪停  送变电   侯光海   \n",
       "1  乐福23K7、乐明23K8电缆耐压试验、GIS导体安装、线路参数测试、抽真空、充气、微水测试...  送变电   蔡如明   \n",
       "2                      #2、#3主变配合110kV侧35kV构架拆除，主变陪停。  送变电   侯光海   \n",
       "\n",
       "                  工作计划时间 停役开始时间 复役结束时间                    备注  周计划编号  \n",
       "0  2021年1月29日-2022年6月15日    NaN    NaN   春节期间相关工作停工，2月18日已开工    NaN  \n",
       "1  2月28日8:30\\n-3月5日18:00    NaN    NaN                   NaN    NaN  \n",
       "2  2021年1月29日-2022年6月15日    NaN    NaN  春节期间相关工作停工，2月18日已开工。    NaN  "
      ],
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>日期</th>\n      <th>编号</th>\n      <th>序号</th>\n      <th>工作地点</th>\n      <th>工作内容</th>\n      <th>工作单位</th>\n      <th>工作负责人</th>\n      <th>工作计划时间</th>\n      <th>停役开始时间</th>\n      <th>复役结束时间</th>\n      <th>备注</th>\n      <th>周计划编号</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>28/2/2021 00:00:00</td>\n      <td>GZ202102280008</td>\n      <td>1</td>\n      <td>慈溪变</td>\n      <td>#2、#3主变配合110kV侧35kV构架拆除，主变陪停</td>\n      <td>送变电</td>\n      <td>侯光海</td>\n      <td>2021年1月29日-2022年6月15日</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>春节期间相关工作停工，2月18日已开工</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>28/2/2021 00:00:00</td>\n      <td>GZ202102280074</td>\n      <td>2</td>\n      <td>福明变</td>\n      <td>乐福23K7、乐明23K8电缆耐压试验、GIS导体安装、线路参数测试、抽真空、充气、微水测试...</td>\n      <td>送变电</td>\n      <td>蔡如明</td>\n      <td>2月28日8:30\\n-3月5日18:00</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>1/3/2021 00:00:00</td>\n      <td>GZ202103010267</td>\n      <td>1</td>\n      <td>慈溪变</td>\n      <td>#2、#3主变配合110kV侧35kV构架拆除，主变陪停。</td>\n      <td>送变电</td>\n      <td>侯光海</td>\n      <td>2021年1月29日-2022年6月15日</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>春节期间相关工作停工，2月18日已开工。</td>\n      <td>NaN</td>\n    </tr>\n  </tbody>\n</table>\n</div>"
     },
     "metadata": {},
     "execution_count": 27
    }
   ],
   "source": [
    "fpath = r'F:\\python\\file_tools\\生产计划管理\\执行情况表\\3月1-27日工作执行表.csv'\n",
    "df = pd.read_csv(fpath)\n",
    "df.head(3)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [
    {
     "output_type": "stream",
     "name": "stdout",
     "text": [
      "<class 'pandas.core.frame.DataFrame'>\nRangeIndex: 512 entries, 0 to 511\nData columns (total 12 columns):\n #   Column  Non-Null Count  Dtype  \n---  ------  --------------  -----  \n 0   日期      512 non-null    object \n 1   编号      512 non-null    object \n 2   序号      321 non-null    object \n 3   工作地点    512 non-null    object \n 4   工作内容    512 non-null    object \n 5   工作单位    512 non-null    object \n 6   工作负责人   296 non-null    object \n 7   工作计划时间  512 non-null    object \n 8   停役开始时间  476 non-null    object \n 9   复役结束时间  118 non-null    object \n 10  备注      168 non-null    object \n 11  周计划编号   0 non-null      float64\ndtypes: float64(1), object(11)\nmemory usage: 48.1+ KB\n"
     ]
    }
   ],
   "source": [
    "df.info()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 29,
   "metadata": {},
   "outputs": [
    {
     "output_type": "stream",
     "name": "stdout",
     "text": [
      "<class 'pandas.core.frame.DataFrame'>\nInt64Index: 153 entries, 0 to 511\nData columns (total 12 columns):\n #   Column  Non-Null Count  Dtype  \n---  ------  --------------  -----  \n 0   日期      153 non-null    object \n 1   编号      153 non-null    object \n 2   序号      109 non-null    object \n 3   工作地点    153 non-null    object \n 4   工作内容    153 non-null    object \n 5   工作单位    153 non-null    object \n 6   工作负责人   87 non-null     object \n 7   工作计划时间  153 non-null    object \n 8   停役开始时间  148 non-null    object \n 9   复役结束时间  118 non-null    object \n 10  备注      122 non-null    object \n 11  周计划编号   0 non-null      float64\ndtypes: float64(1), object(11)\nmemory usage: 15.5+ KB\n"
     ]
    }
   ],
   "source": [
    "df.drop_duplicates(subset=['工作地点','工作内容','工作单位','工作计划时间'],keep='last',inplace=True)\n",
    "df.info()\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 30,
   "metadata": {},
   "outputs": [],
   "source": [
    "df.to_excel('3月1-27工作执行情况（去重）.xlsx')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ]
}